Made-to-Measure data kurser
1 Hvad stedet nu hedder for tiden.
2 Roskilde Universitetsbibliotek
KUB Datalab er Københavns Universitetsbiblioteks tilbud til studerende om vejledning og undervisning i arbejde med data. Vi tilbyder kurser i grundlæggende programmering, dataanalyse og -visulisering, blandt meget andet.
Studerende henvender sig regelmæssigt med ønsker om kurser med meget specifikt indhold. Dette behov vil vi gerne imødekomme, men det er for ressourcekrævende at skulle udvikle enkeltstående kurser for måske kun 5 studerende.
Vi har derfor udviklet et meget omfattende generelt kursus, der dækker mange, men dog ikke alle, de eksempler på konkrete ønsker vi har oplevet. Dog foreløbig kun i programmeringssproget R, omend de fleste af teknikkerne er sprog-agnostiske.
Materialet er opbygget i Workbench infrastrukturen fra Carpentries (“The Carpentries” 2025) med brug af sandpaper (Kamvar and Nitta 2024) pakken, og tilgængeliggjort på GitHub.
Det indeholder en samling af “episoder”, ideelt i en længde svarende til ca. 25 minutters undervisning. Episoderne kan ikke være fuldstændigt uafhængige; nogle emner baserer sig på en forståelse af grundlæggende statistiske begreber og kendskab til R, men idealet er at de er så uafhængige af andre som muligt, men så afhængige som nødvendigt.
Kursets didaktiske tilgang er baseret på Teaching Tech Together (Wilson 2019) og Carpentries (“The Carpentries” 2025) filosofien. Der er fokus på “code-along” hvor de studerende forventes og opfordres til at “taste med”. Målet er ikke at dække mest mulig teori, men at efterlade de studerende med praktiske færdigheder. etc.
Figure 1: Kursussiden
Med udgangspunkt i Github-pages, klones den samlede kursusside til et nyt repositorie på Github. Baseret på de konkrete behov redigeres en enkelt setup-fil, så kun de ønskede episoder indgår. Redigeringen tager under fem minutter, mens det tager GitHub op til en halv time at “bygge” siden.
To get a better understanding of how to include features like these please refer to the {posterdown} wiki.
Now on to the results!
Tematiseret episodeliste
Reproducible Data Analysis Tidy Data
Reading data from file Descriptive Statistics Table One
The normal distribution Testing for normality How is the data distributed?
Linear regression Multiple Linear Regression Logistic regression
Central Limit Theorem
Nicer barcharts
Power Calculations k-means Tuning kmeans ANOVA R on Ucloud A deeper dive into pipes Setup for GIS
Shiny without the server Choropleths What to do with data that is not normal building-models lasso-regularisation ridge-regularisation elastic-net-regularisation
Figure 2: Det kan være svært at overvinde trangen til at tilføje mere. (Horst 2025)
Panum UngdomsForsker Forening, PUFF, er en studenterforening drevet af frivillige medicinstuderende på Københavns Universitet, der arbejder for at forbedre vilkårene for medicinsk studenterforskning.
PUFF har gennem flere år tilbudt et kursus i statistisk metode & det statistiske programmeringssprog R. Kurset blev gennemført over 5 eftermiddage/aftener á 3 timer, og med en professor i biomedicinsk statistik som underviser. Efter COVID-19 pandemien oplevede de vanskeligheder med at tiltrække deltagere til det relativt dyre kursus.
KUB Datalab har siden 2023 overtaget R-delen af kurset, baseret på materiale trukket fra vores toolbox.
Ud over at danne grundlag for målsyede kurser, fungerer værktøjskassen også som intern videnbank, hvor vi kan finde noter om hvordan man gør specifikke ting.
Made-to-Measure data kurser